Was ist shapiro wilk test?

Der Shapiro-Wilk-Test ist ein statistischer Test, der verwendet wird, um zu überprüfen, ob eine Stichprobe aus einer Normalverteilung stammt. Er gehört zur Kategorie der <a href="https://de.wikiwhat.page/kavramlar/normalverteilung">Normalitätstests</a>.

Kernidee: Der Test vergleicht die geordnete Stichprobenstatistik mit den erwarteten Werten unter der Annahme der Normalverteilung. Wenn die Daten normalverteilt sind, sollten die geordneten Stichprobenwerte ungefähr linear mit den erwarteten Werten übereinstimmen.

Hypothesen:

  • Nullhypothese (H0): Die Daten stammen aus einer Normalverteilung.
  • Alternative Hypothese (H1): Die Daten stammen nicht aus einer Normalverteilung.

Teststatistik (W): Der Shapiro-Wilk-Test berechnet eine Teststatistik W, die zwischen 0 und 1 liegt. Ein Wert nahe 1 deutet darauf hin, dass die Daten normalverteilt sind, während ein Wert nahe 0 darauf hindeutet, dass die Daten nicht normalverteilt sind.

p-Wert: Der Test liefert einen <a href="https://de.wikiwhat.page/kavramlar/p-wert">p-Wert</a>. Wenn der p-Wert kleiner als das Signifikanzniveau (üblicherweise 0,05) ist, wird die Nullhypothese verworfen, und man schließt, dass die Daten nicht normalverteilt sind. Andernfalls wird die Nullhypothese nicht verworfen.

Interpretation:

  • p ≤ α: Die Daten sind nicht normalverteilt (H0 wird verworfen).
  • p > α: Die Daten sind normalverteilt (H0 wird nicht verworfen). Beachte: Das Nicht-Verwerfen der Nullhypothese bedeutet nicht, dass die Daten beweisen normalverteilt zu sein, sondern lediglich, dass es keine ausreichenden Beweise gegen die Normalverteilung gibt.

Vorteile:

  • Gilt als einer der leistungsstärkeren Normalitätstests, besonders für kleine Stichprobengrößen.

Nachteile:

  • Die Aussagekraft des Tests nimmt bei großen Stichprobengrößen zu, was dazu führen kann, dass kleine Abweichungen von der Normalität als signifikant erkannt werden.
  • Der Test ist empfindlich gegenüber Ausreißern.
  • Ergebnisse können bei diskreten Daten irreführend sein.

Anwendung:

Der Shapiro-Wilk-Test wird häufig verwendet, um die Annahme der Normalverteilung für viele statistische Tests zu überprüfen (z. B. t-Tests, ANOVA). Es ist wichtig zu beachten, dass viele statistische Tests robust gegenüber Verletzungen der Normalverteilungsannahme sind, insbesondere bei großen Stichprobengrößen (siehe <a href="https://de.wikiwhat.page/kavramlar/zentraler%20grenzwertsatz">Zentraler Grenzwertsatz</a>).

Implementierung in Software:

Der Shapiro-Wilk-Test ist in vielen Statistikprogrammen wie R, Python (SciPy), SPSS und SAS implementiert.